时政
财经
科技
虚拟货币
其他
登录
#Google Gemini
关注
sitin
1周前
Google Gemini 应用上线了面向所有用户的新学习工具:Guided Learning,致力于增强批判性思维、深化理解并提升学习效率。 它不是一个“给答案”的工具,而是一个 AI 家教练,通过提问、互动、多媒体内容和分步讲解,引导学生主动思考、深度理解知识点。 1.三大配套功能 引导式学习:分步拆解难题、量身定制解释、支持上传个人资料。 可视化体验:自动配图、信息图、YouTube 视频,帮助理解抽象概念。 智能备考:自动生成抽认卡、学习指南,针对错题给出知识点与练习。 2.教育化设计 为教师提供可直接嵌入 Google Classroom 的链接,打造无评价、鼓励探索的学习环境。 3.技术底座 由 Google 专为学习优化的 LearnLM 模型家族支持,已集成进 Gemini 2.5。
Google Gemini 2.5发布引发AI模型性价比热议· 97 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 329 条信息
#Google Gemini
#Guided Learning
#AI教育
#批判性思维
#LearnLM模型
分享
评论 0
0
Guangzheng Li
1周前
Google Gemini 的 StoryBook 功能用了 20+ 个 Agents,其中 6 个是专门为故事书功能设计的核心 Agents: 1. Writer - 负责创作故事内容 2. Storyboarder - 分镜和插图说明 3. NewStorybook - 核心 Agent 4. IllustratorSingleCall - 插画导演 5. Animator - 动画导演 6. Photos - Google Photos 集成
Google Gemini 2.5发布引发AI模型性价比热议· 97 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 329 条信息
#Google Gemini
#StoryBook功能
#Agents
#故事创作
#插画
分享
评论 0
0
sitin
2周前
NotebookLM 是 Google Labs 推出的 AI 研究和笔记工具,基于 Google Gemini 模型, 可帮助用户上传并分析 PDF、网站、YouTube 视频、音频文件、Google Docs 或 Google Slides 等资源,生成摘要、解答问题并提供清晰引用,还支持将内容转化为播客式音频对话(Audio Overviews),方便随时随地学习 最近,NotebookLM 的视频概览功能线,用户可以前后跳转10秒,并调整播放速度,目前仅支持英语和桌面端。 通过将复杂的信息转化为易于理解的幻灯片,并配以旁白,为用户的学习过程增添了一份视觉辅助。 能够根据用户请求的主题,自动生成相关的视频内容。用户上传的图片、图表、引用和文档等信息都可以被提取和整合,从而帮助更好地阐述主题。
谷歌Deep Research:AI操作系统雏形?· 39 条信息
#NotebookLM
#Google Gemini
#AI研究工具
#视频概览功能
#教育辅助
分享
评论 0
0
ginobefun
2个月前
推荐阅读 20250618 ① 🤖 Andrej Karpathy 万字演讲精华:软件 3.0 时代来临 - 详解软件 3.0 概念:继传统代码 (1.0) 和神经网络 (2.0) 之后,“提示词即程序” (Prompts as Programs) 成为新范式。 - 提出 LLM 心理学两大问题:智能水平参差不齐 (Jagged Intelligence) 与顺行性遗忘症 (Anterograde Amnesia)。 - 强调“部分自主” (Partial Autonomy) 是关键,通过“自主性滑块” (Autonomy Sliders) 平衡人机协作,跨越 Demo 与产品之间的鸿沟。 - 呼吁开发者“为智能体而构建” (Build for Agents),未来的软件需要同时服务于人类、API 和智能体。 📖 详细: ② 💻 揭秘 Google Gemini 顶级 AI 编码模型诞生记: - 反思传统标准:深入探讨为何像“竞赛编程”这类 benchmark,并不能真实反映开发者在大型代码库中的实际工作流与需求。 - 成功的核心要素:揭示顶尖编码模型成功的关键,不仅在于高质量的代码数据,更在于其背后强大的通用推理能力、世界知识以及百万级长上下文窗口的支撑。 - 未来方向:讨论 AI 编码工具的未来,将从代码补全进化到更复杂的代码库级别任务,并通过 Agentic 的方式与开发者进行更深度的协作。 📖 原始视频: 中文克隆播客: ③ 🤖 深度解读 OpenAI 官方 AI 智能体构建指南: - 三大核心基石:系统拆解智能体的核心组件——模型 (Model) 是大脑,工具 (Tools) 是手脚,指令 (Instructions) 是行为准则,三者分离的设计是构建灵活、可维护智能体的关键。 - 渐进式架构:倡导从简单的单一智能体起步,在验证价值后,根据需求演进到多智能体编排模式,如中心化的“主管模式” (Manager Pattern) 或分布式的“去中心化模式” (Decentralized Pattern)。 - 安全与信任:强调必须内置“分层防御”安全护栏(如 PII 过滤、风险评估)和清晰的“人工监督” (Human-in-the-Loop, HITL) 机制,确保智能体在关键时刻安全可控。 📖 详细: PDF 地址: ④ 🤖 Google Gemini 2.5 家族迎来全面更新: - 全新成员登场:推出 Gemini 2.5 Flash-Lite 预览版,这是该系列中成本和延迟最低的模型,专为分类、摘要等大规模高吞吐量任务而设计。 - Pro 与 Flash 进入稳定期:Gemini 2.5 Pro 和 Gemini 2.5 Flash 现已正式通用 (GA),为开发者在生产环境中构建应用提供了更高的稳定性和可靠性。 - Flash 定价调整:Gemini 2.5 Flash 更新了定价,取消了“思考”与“非思考”的价格差异。新的价格为输入 $0.30/百万 Token,输出 $2.50/百万 Token。 - 全系具备“思考”能力:所有 2.5 模型都具备推理能力,允许开发者通过控制“思考预算”来平衡模型的响应速度和准确性。 📖 详细: ⑤ 🚨 深度复盘:谷歌云 6.12 全球中断事件 - 根本原因: 核心组件 Service Control 中一个未受功能开关保护的新功能,因一个空指针 bug 被错误的配置数据触发,并通过 Spanner 数据库被快速同步至全球。 - 关键失误 1 - 缺乏功能开关: 新代码在未受控的情况下被激活,导致 bug 一旦触发就无法被隔离,造成了全球性的影响。 - 关键失误 2 - 恢复与沟通: us-central-1 区域因“羊群效应”恢复缓慢;官方状态页本身也因托管在故障设施上而中断,导致信息真空。 - 核心教训: 展示了在大型分布式系统中,一个微小的代码缺陷如何通过自动化流程被放大为全球性灾D难,强调了纵深防御和基础工程纪律的重要性。 📖 详细:
谷歌Deep Research:AI操作系统雏形?· 39 条信息
#软件3.0时代
#LLM心理学
#Google Gemini
#AI编码模型
#OpenAI智能体
#谷歌云中断事件
#技术故障
#AI安全
分享
评论 0
0
Geek
2个月前
🎨 Gemini Image App 一个现代化的全栈 AI 图像处理平台,集成了 Google Gemini、OpenCV 和 YOLO 等先进技术,提供图像问答、生成、编辑、目标检测、图像分割和视频生成等功能。
#AI
#图像处理
#Google Gemini
#OpenCV
#YOLO
#目标检测
#图像分割
#视频生成
分享
评论 0
0
orange.ai
6个月前
卧槽,我在 Google Gemini Thinking 中竟然体验到了 DeepSeek R1 Zero 的论文里提到的语言的混乱现象 出现了很多种,完全分辨不出来是什么语言... 难道 Google 这个思考模型也是靠大量 RL 搞出来的吗?
#Google Gemini
#DeepSeek R1 Zero
#语言混乱
#思考模型
#RL
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞